llm

大模型如何突破“认知茧房”?RAG+MCP构建外部脑接口

在大型语言模型(LLM)日臻成熟的今天,如何突破其固有限制成为关键议题。检索增强生成(RAG)与多模态上下文处理(MCP)技术正成为驱动大模型能力跃升的核心引擎。本文深入探讨两大技术在信息实时性、知识精准度及多维度感知方面的突破性价值及其协同演进路径。

模型 模态 rag llm mcp 2025-11-13 21:39  2

AI Agent,你不懂的都在这里

AI Agent 正在成为产品与组织的新变量,但关于它的误解也在迅速蔓延:它是工具?是助手?是“拟人化”的幻觉?本文从五个关键问题出发,拆解 AI Agent 的能力边界与协作价值,帮助你厘清认知、校准预期,并找到真正值得投入的方向。

llm agent aiagent acting mcts 2025-11-13 16:21  2

我们不是在造新物种,是在造&

当所有人都在喊 “智能体元年” 的时候,Karpathy 直接泼了盆冷水,他说:别想了,这是 “智能体的十年”。大神如此判断,并非悲观,而是一线从业者最清醒的洞察 —— 现在的 AI 智能体根本不好用,你不敢雇它当实习生,因为它不够聪明,无法理解多模态信息,不

模型 智能体 llm karpathy 放射科医生 2025-10-29 17:56  2

港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」

论文第一作者何浩然是香港科技大学博士生,研究方向包括强化学习和基础模型等,研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计算机科学与工程系助理教授潘玲。

模型 推理 范式 llm 算法 2025-10-31 12:09  2

DeepSeek OCR为什么这么“惊艳”

在大模型浪潮中,OCR 技术似乎已成“老生常谈”。但 DeepSeek OCR 的出现,却让人重新审视“识别”这件事的边界。本文从技术架构、能力表现到产品体验,拆解它为何能在一众模型中脱颖而出,成为真正“惊艳”的存在。

llm deepseek ocr deepseekocr 2025-10-31 10:44  2

DeepSeek悄悄上线新模型

在华为旗下的学术平台“黄大年茶思屋”上,有技术专家甚至指出,该模型的核心构件视觉encoder的高效解码,为光计算和量子计算在LLM(注:大语言模型)领域的引入提供了明确的技术路径。

模型 ultra llm deepseek 乔楠 2025-10-31 09:31  2

AI也能写学术论文了?上海交大团队揭开大模型撰写科研综述的秘密

研究团队发现了一个让人意外的现象:虽然目前的AI系统确实能够生成看起来很专业的综述论文,表面上读起来很流畅,逻辑也算清晰,但仔细检验后发现,这些AI生成的综述在深度和准确性方面与人类专家撰写的综述相比,仍然存在显著差距。这就好比一个学生背诵了教科书的内容,能够

模型 论文 llm 科研 学术论文 2025-10-31 00:11  2